Gemma 2 上线了

Original renee创业狗 Renee 创业随笔

2024-10-09

Gemma 2 是 Google 的开放模型，Google IO的时候发布，接着上周上线了。之前已经介绍过 Gemma 1，今天看看 Gemma 2有哪些迭代。

简介

上周，Google正式向全球研究人员和开发人员发布 Gemma 2。Gemma 2 提供 90 亿（9B）和 270 亿（27B）参数两种规格，相较于第一代，性能更高，推理效率更佳，并且在安全性方面有了显著提升。27B 参数的 Gemma 2 提供了与体积大一倍以上的模型相媲美的竞争力（感觉说的是Llama3），能够实现之前仅在去年十二月才能通过专有模型实现的性能（感觉说的是GPT4）。可以跑在 NVIDIA H100 Tensor Core GPU 或 TPU 主机，大大降低了部署成本。

特点

卓越性能：27B 参数的 Gemma 2 提供最佳性能，甚至超越体积大一倍以上的模型。9B 参数的 Gemma 2 也超越了 Llama 3 8B 及其他同类开放模型。
高效节约：27B 参数的 Gemma 2 可在 Google Cloud TPU、NVIDIA A100 80GB 或 H100 上高效运行，降低成本的同时保持高性能，使 AI 部署更具经济性。
极速推理：Gemma 2 优化后可在各种硬件上高速运行，从游戏笔记本到云端设置。在 Google AI Studio 以全精度体验，通过 Gemma.cpp 在 CPU 上解锁本地性能，或在家用计算机上使用 NVIDIA RTX 或 GeForce RTX。

评测

官方提供的基准测试结果：

LMSYS Chatbot Arena Leaderboard：

Gemma 家族其他产品

PaliGemma：是一个多功能、轻量级的视觉语言模型（VLM），灵感来自 PaLI-3，基于 SigLIP 视觉模型和 Gemma 语言模型等开放组件构建。
RecurrentGemma：一个具有固定状态大小的开放模型，适用于对长序列进行快速推理。
CodeGemma：基于 Gemma 的开放代码模型。

试用

除了上文提到的Google AI Studio，Gemma 2 也通过与 Hugging Face、NVIDIA 和 Ollama 等平台的集成，轻松获取。

Ollama

9B 参数

ollama run gemma2

27B 参数

ollama run gemma2:27b

编排工具中使用 Gemma2

LangChain

from langchain_community.llms import Ollama
llm = Ollama(model="gemma2")
llm.invoke("Why is the sky blue?")

LlamaIndex

from llama_index.llms.ollama import Ollama
llm = Ollama(model="gemma2")
llm.complete("Why is the sky blue?")

继续滑动看下一个

Renee 创业随笔

向上滑动看下一个

继济南解放阁鬼火炸街少年后，汕头又出现了大量炸街少年。

白石洲拆迁后，那些上学奔波的孩子都去哪儿了？

重阳节

杨绛：记住，和周围人搞好关系的秘诀就是，不要和他们分享任何成功的喜悦，和任何开心的事儿！

一个医保局长之死

Gemma 2 上线了

简介

特点

Gemma 家族其他产品

试用

Ollama

LangChain

LlamaIndex

您可能也对以下帖子感兴趣

继济南解放阁鬼火炸街少年后，汕头又出现了大量炸街少年。

白石洲拆迁后，那些上学奔波的孩子都去哪儿了？

重阳节

杨绛：记住，和周围人搞好关系的秘诀就是，不要和他们分享任何成功的喜悦，和任何开心的事儿！

一个医保局长之死

生成图片，分享到微信朋友圈

Gemma 2 上线了

简介

特点

Gemma 家族其他产品

试用

Ollama

LangChain

LlamaIndex

您可能也对以下帖子感兴趣